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人 为 了 全 面 推进 生态 环境 大 
数据 的 建设 和 应 用 ,综述 了 生态 环境 大 数据 在 解决 生态 环境 问题 中 的 机 遇 和 优势 ,并 分 析 了 生态 环境 大 数据 在 应 用 中 所 面临 的 
挑战 。 总 结 和 概括 了 大 数据 的 概念 与 特征 ,又 结合 生态 环境 领域 的 特点 ,分 析 了 生态 环境 大 数据 的 特殊 性 和 复杂 性 。 重 点 阐述 
了 生态 环境 大 数据 在 减缓 环境 污染 、 生 态 退 化 和 气候 变化 中 的 机 遇 , 主 要 从 数据 存储 、 人 处理 .分 析 \ 解 释 和 展示 等 方面 阐述 生态 
环境 大 数据 相 较 于 传统 数据 的 优势 ,通过 这 些 优势 说 明生 态 环 境 大 数据 将 有 助 于 全 面 提 高 生态 环境 治理 的 综合 决策 水 平 。 虽 
然 生态 环境 大 数据 的 应 用 前 景 广阔 ,但 也 面临 着 重重 挑战 ,在 数据 共享 和 开放 、 应 明 创 新 、 数 据 管理 、 技 术 创新 和 落地 、 专 业 人 才 
培养 和 资金 投入 等 方面 还 存在 着 许多 问题 和 困难 。 在 以 上 分 析 的 基础 上 ,提出 了 生态 环境 大 数据 未 来 的 发 展 方向 ,包括 各 类 生 
态 环境 数据 的 标准 化 、 建 设 生 态 环 境 大 数据 存储 与 处 理 分 析 平 台 和 推动 国内 外 生态 环境 大 数据 平台 的 对 接 。 
关键 词 :大 数据 ;生态 环境 大 数据 ;生态 环境 问题 ;环境 污染 ;生态 退化 后 候 变 佛 
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The opportunities and challenges presented by ecological environment big data 
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Abstract: With the arrival of the era of Tiaidqata and the rapid development of big data technology, the construction and 
application of ecological environment bigWdata have been initiated. To comprehensively promote the construction and 
application of ecological environiment \big data, we summarize in the present paper the opportunities and advantages 
presented by ecological enviroiiment big data in terms of solving ecological environment problems, and analyze the 
challenges faced regarding the application of ecological environment big data. We review the concept and basic features of 
big data and present the \partieularity and complexity of the characteristics of ecological environment big data, taking into 
consideration the characteristics of the ecological environment. Subsequently, we primarily analyze the opportunities 
presented by ecological environment big data in mitigating environmental pollution, ecological degradation, and climate 
change from the aspects of data storage, data processing, data analysis data interpretation, and presentation, and compare 
these with the tse of traditional ecological environment data. The advantages of ecological environment big data indicate that 
this type of data can help us to improve the comprehensive decision-making level of ecological environment management. 
Although prospects for the applications of ecological environment big data in China are promising, there exist potential 
difficulties and challenges, such as data sharing, dataassessing, data application innovation, data management, 


technological innovation and launch, professional personnel training, and capital investment. Finally, we propose the 
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following three priority areas concerning ecological environment big data based on our thorough review: (1) standardization 
of all types of ecological environment data; (2) building the storage, processing, and analysis platforms of ecological 
environment big data storage and processing analysis; (3) pushing forward the docking of ecological environment big data at 


home and abroad. 


Key Words: big data; ecological environment big data; ecological environment problems; environmental pollution ; 


ecological degradation; climate change 


网 络 信息 技 术 与 网 络 通信 技术 的 融合 , 极 大 地 促进 了 互联 网 、 物 联网 、 云 计算 和 智能 传感器 的 快速 兴起 和 
发 展 ,使 得 人 类 社会 获得 的 数据 信息 呈 爆 炸 式 增长 ,大 数据 时 代 正 在 悄然 走 来 '"。 大 数据 的 价值 主要 体现 
在 大 数据 的 应 用 上 ,因为 人 们 关心 大 数据 ,最 终 还 是 关心 大 数据 的 应 用 ,关心 如 何 氛 不 同行 业 的 业务 需求 和 应 
用 出 发 让 大 数据 真正 实现 其 所 蕴含 的 价值 ,从 而 为 人 们 的 生产 生活 带 来 有 益 的 改变 ' 各 1 。 哮 休 而 言 , 全 球 的 
大 数据 应 用 处 于 发 展 初 期 ,中 国 大 数据 应 用 才刚 刚 起 步 。 目 前 ,大 数据 应 用 在 各 行 各 业 的 发 展 呈 现 “ 阶梯 式 ” 
格局 :互联 网 行业 是 大 数据 应 用 的 领跑 者 ,金融 .零售 .电信 公共 管理 .医疗 卫生 等 领域 下 积极 尝试 大 数据 , 而 
生态 环境 大 数据 应 用 则 刚刚 起 步 '* 1。 
目前 ,大 数据 在 生态 环境 领域 的 应 用 还 仅 限于 生态 环境 领域 的 某 个 衣 面 : 姑 环 保 系统 ,缺少 跨行 业 跨 部 门 
互 ”的 应 用 ,不 能 真正 体现 生态 环境 大 数据 作为 一 个 整体 的 优势 …& 星 帮 20 往 纪 中 叶 ,“ 大 数据 ”的 思想 已 在 宏 
国 观 生 态 学 方面 得 到 体现 ,例如 ,被 称 为 大 科学 研究 的 国际 地 球 物理 年 (1957 一 1958) 和 国际 生物 学 计划 (IBP) 
©O (1964 一 1974) ,这 些 人 研究 最 后 演变 成 现在 的 以 长 期 定位 观测 为 基础 的 国内 外 生态 系统 研究 网 络 ,这 些 生 态 系 
一  。 统 研 究 网 络 系统 地 收集 和 存储 有 关 生 态 环境 的 海量 观测 数据 ”"" 。 另 外 ,大 数据 在 生物 多 样 性 保护 和 农业 方 
中 。 面 也 得 到 了 一 些 应 用 ,例如 ,很 多 国家 和 地 区 已 经 万 正在 建设 生物 多 样 性 信息 管理 系统 ;美国 硅谷 一 家 公 
司 利 用 气象 数据 与 历年 农作物 产量 进行 关联 分 析 ,预测 各 地 农场 来 年 产量 和 适宜 种 植 品 种 ,并 以 个 性 化 保险 
服务 向 农户 出 售 '。 在 环境 领域 ,大 数据 在 美国 环境 污染 防治 管理 中 得 到 了 初步 的 应 用 '! 直 。2016 年 3 月 ， 
我 国 环保 部 发 布 了 《生态 环境 大 数据 建设 总 体 方案 》 ,为 环保 系统 开展 生态 环境 大 数据 建设 提供 了 强 有 力 
的 政策 支持 和 技术 框架 ,这 也 意味 着 大 数据 在 我 国 环 境 领域 的 应 用 才刚 刚 起 步 。 鉴 于 以 上 大 数据 在 生态 环境 
领域 的 应 用 现状 ,本 文 阐述 了 生态 环境 大 数据 的 独 有 特点 ,梳理 了 大 数据 在 解决 生态 环境 问题 中 的 优势 和 机 
中 通 , 总 结 了 生态 环境 大 数据 建设 所 面临 的 挑战 ,并 提出 了 生态 环境 大 数据 未 来 的 发 展 方向 ,为 生态 环境 大 数据 
的 发 展 和 大 规模 应 用 提供 依据 。 


Trl 


1 大 数据 概述 


虽然 备 国都 在 积极 准备 迎接 大 数据 时 代 的 到 来 ,但 国内 外 关于 大 数据 的 定义 、 内 涵 和 标准 还 没有 达成 统 
一 认识 时 根据 夫 家 对 大 数据 定义 有 着 不 同 的 侧重 点 ,可 以 将 其 分 为 三 类 :第 一 类 定义 主要 突出 “大 ” “4 ,例如 
麦肯锡 IDCS 亚 马 示 .维基 百科 等 给 出 的 定义 “大 ”只 是 大 数据 的 重要 标志 之 一 ,但 并 不 是 全 部 "'' 。 第 二 类 定 
义 主 要 是 突出 其 "作用 ”, 认 为 大 数据 是 在 多 样 或 者 大 量 数据 中 , 迅速 获取 信息 的 能 力 , 与 第 一 类 只 从 数据 本 
苹 出 发 不 同 ,该 类 定义 强调 大 数据 的 功能 和 作用 。 第 三 类 定义 主要 突出 其 “价值 观 和 方法 论 ” ,认为 大 数据 
是 用 轿 新 的 思维 和 技术 对 海量 数据 进行 整合 分 析 , 从 中 发 现 新 的 知识 和 价值 , 带 来 “大 知识 ”“ 大 科技”“ 大 
利润 ”和 “大 发 展 ””。 但 随 着 全 球 数据 的 飞速 增长 ,除了 包含 传统 的 结构 化 数据 ,还 产生 大 量 非 结构 化 数据 
和 半 结 构 化 数据 ,这 就 需要 大 量 处 理 技术 来 处 理 这 些 不 同 结构 的 数据 ,并 将 它们 应 用 在 实践 中 中 。 因 此 ,大 
数据 不 仅仅 包含 海量 数据 ,还 应 包括 各 种 大 数据 技术 的 集合 和 大 数据 在 各 领域 的 应 用 。 综 合 以 上 信息 ,我 
们 认为 大 数据 是 为 决策 问题 提供 服务 的 大 数据 集 、 大 数据 技术 和 大 数据 应 用 的 总 称 。 

目前 对 大 数据 普遍 认可 的 是 其 基 有 以 下 “5V” 特 点 中 。 第 一 ,数据 量 巨 大 。 通 过 各 种 设备 产生 的 海量 
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数据 ,规模 庞大 ,数据 量 从 TB 级 别 跳跃 到 PB 级 别 “” 。 第 二 ,数据 种 类 繁多 。 数 据 来 源 种 类 多 样 化 ,不 仅 包 
括 传统 结构 化 数据 ,还 包括 各 种 非 结 构 化 数据 和 半 结 构 化 数据 ,而 且 非 结构 化 数据 所 占 比例 越 来 越 高 ”” 。 
第 三 ,大 数据 的 “ 快 ” ,包括 数据 产生 快 和 具备 快速 实时 的 数据 人 处理 能 力 两 个 层面 。 第 一 层面 是 数据 产生 的 
快 。 目 前 有 的 数据 是 爆发 式 产生 ,例如 ,欧洲 核子 研究 中 心 的 大 型 强 子 对 接 机 在 工作 状态 下 每 秒 产 生 
PB 级 的 数据 ;有 的 数据 是 涓涓 细 流 式 产生 ,但 是 由 于 用 户 众 多 , 短 时 间 内 产生 的 数据 量 依然 非常 庞大 ,例如 ， 
点 击 流 .日志 、 射 频 识 别 数据 .GPS( 全 球 定位 系统 ) 位 置信 息 " 。 第 二 层面 是 对 数据 快速 .实时 处 理 的 能 
高 。 大 数据 技术 通过 发 展 不 同 于 传统 的 快速 处 理 的 算法 ,对 海量 动态 数据 进行 处 理 分 析 ,使 它们 变 为 可 征用 
的 有 价值 数据 。 因 此 ,大 数据 对 实时 处 理 有 着 较 高 的 要 求 ,数据 的 处 理 效率 就 决定 着 获得 信息 的 能 为 汪 。 
第 四 ,数据 价值 密度 低 、 应 用 价值 高 。 大 量 不 同 数据 集 组 成 大 数据 集 ,这 些 数据 集 的 价值 密度 的 高 低 与 数据 集 
总 量 的 大 小 成 反比 。 在 大 数据 应 用 中 ,数据 量 大 的 数据 并 不 一 定 有 很 大 的 价值 ,不 能 被 及 时 有 效 处 理 分 析 的 
数据 也 没有 很 大 的 应 用 价值 “” 。 第 五 ,真实 性 低 。 随 着 社交 数据 .企业 内 容 、 交 易 与 应 用 数据 等 新 数据 源 的 
兴起 ,我 们 能 获得 的 数据 源 逐 渐 多 样 化 ,这 使 得 获得 的 数据 中 有 些 具有 模糊 性 “| 。 真实 性 将 促使 人 们 利用 数 
据 融 合 和 先进 的 数学 方法 进一步 提升 数据 的 质量 ,从 而 创造 更 高 价值 。 例 如 ,社交 网 络 中 的 视频 、 语 音 , 日 志 
等 获得 的 原始 数据 真实 性 差 ,需要 我 们 对 其 过 滤 和 处 理 才 能 挑 出 有 用 的 数据 


2 生态 环境 大 数据 特点 


大 数据 在 解决 生态 环境 问题 时 形成 了 生态 环境 大 数据 独一无二 的 特征 。 第 一 ,生态 环境 大 数据 具有 “ 空 
天 地 一 体 ” 的 巨大 数据 量 。 从 数据 规模 来 看 ,生态 环境 数据 体 量 大 也 多 据 量 也 已 从 TB 级 别 跃 升 到 PB 级 别 。 
随 着 各 类 传 感 需 、.RFID 技术 .卫星 适 感 .雷达 和 视频 感知 等 抠 术 的 发 展 , 数 据 不 仅 来 源 于 传统 人 工 监测 数据 ， 
还 包括 航空 .航天 和 地 面 数 据 , 他 们 一 起 产生 了 海量 生态 环境 数据 。 例 如 ,2011 年 世界 气象 中 心 就 已 经 积累 
了 229TB 的 数据 ' ;我 国 林业 ,交通 .气象 和 环保 等 数据 量 级 也 都 达到 了 PB 级 别 ,而 且 还 在 以 每 年 数 百 个 TB 
的 速度 在 增加 。 第 二 ,生态 环境 大 数据 的 类 型 \ 来 源 和 格式 具有 复杂 多 样 性 5 。 从 数据 种 类 来 看 ,生态 
环境 数据 类 型 多 ,数据 来 源 渠道 广 ,结构 复 淋 几 首 先 ,生态 环境 数据 来 自 于 气象 水利 国土. 农业、 林业 、 交 通 、 
社会 经 济 等 不 同 部 门 的 各 种 数据 ;其 次 ,大 数据 技术 的 发 展 使 得 生态 环境 领域 的 研究 不 再 局 限于 传统 结构 化 
数据 类 型 ,使 得 各 种 半 结 构 化 和 非 结 构 化 数据 (文本 项目 报告 .照片 .影像 声音、 视频 等 ) 的 应 用 与 分 析 成 为 
可 能 ,例如 ,一 段 历史 电影 视频 中 关于 气候 的 描述 ;公众 移动 手机 拍摄 的 关于 植物 类 别 的 图 片 等 ;再 次 ,来源 于 
不 同 部 门 的 同一 种 数据 其 格式 多 样 、 目 前 无 统一 的 标准 规范 ,使 得 难以 整合 和 合并 不 同 部 门 之 间 的 同类 数据 。 
第 三 ,生态 环境 大 数据 需要 动态 新 数据 和 历史 数据 相 结合 处 理 '”; 。 从 数据 处 理 速度 来 看 ,由 于 生态 系统 结构 
与 功能 的 动态 变化 而 引起 的 生态 环境 数据 具有 强烈 的 时 空 异 质 性 ,生态 环境 数据 多 表现 为 流 式 数据 特征 , 实 
时 连续 观测 尤为 重要 。 只 有 实时 处 理 分 析 这 些 动态 新 数据 ,并 与 已 有 历史 数据 结合 起 来 分 析 , 才 能 挖掘 出 有 
用 信息 ,为 解决 有 头 生 态 环境 问题 提供 科学 决策 。 第 四 ,生态 环境 大 数据 具有 很 高 的 应 用 价值 。 从 数据 价值 
来 看 ,生态 环境 夫 数 据 无 疑 具 有 巨大 的 潜在 应 用 价值 ,利用 大 数据 技术 从 海量 数据 中 挖掘 出 最 有 用 的 信息 ,把 
低 价值 数据 转换 为 高 价值 数据 ,最 终 , 高 价值 大 数据 为 解决 各 种 生态 环境 问题 提供 科学 依据 ,从 而 改善 人 类 生 
存 环境 和 提高 人 们 生活 质量 ;第 五 ,生态 环境 大 数据 具有 很 高 的 不 确定 性 。 从 数据 真实 性 来 看 ,虽然 应 用 于 生 
态 环 境 领 域 的 各 种 传感器 监测 精度 都 很 高 , 正 是 因为 这 一 点 仪器 往往 会 顺带 记录 大 量 的 周边 环境 数据 , 而 我 
们 感 兴趣 的 数据 可 能 会 埋没 在 大 量 数据 中 ,因此 ,为 了 确保 数据 的 精准 度 ,需要 利用 大 数据 技术 从 海量 数据 中 
去 伪 存 真 ,获取 真实 数据 。 


3 ”大 数据 在 解决 生态 环境 问题 中 的 优势 和 机 遇 


20 世纪 后 半 叶 以 来 , 随 着 经 济 的 发 展 , 全 球 生态 环境 问题 日 趋 严重 。 目 前 全 球 生态 环境 问题 突出 表现 在 
环境 污染 .气候 变化 .土地 退化 、 森 林 锐 减 ,生物 多 样 性 丧失 以 及 水 资源 枯竭 等 方面 。 这 些 问 题 往往 涉及 尺 
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的 治理 这 
来 相当 困 


度 大 ,过程 复杂 、 驱 动因 素 众 多 ,解决 起 来 难度 大 。 随 着 大 数据 时 代 的 到 来 ,大 数据 为 各 种 生态 环境 问题 的 解 
随 着 工业 化 ,城市 化 化 学 农业 和 机 动 化 的 高 速 发 展 ,全 球 环境 污染 日 益 加 剧 , 以 大 气 污染 水 污染 和 土壤 


决 提供 了 新 的 机 遇 。 

3.1 大 数据 在 解决 环境 污染 中 的 优势 

污染 为 主 的 三 大 污染 引起 的 食品 安全 和 人 类 健康 问题 严峻 ,直接 威胁 到 人 类 的 生命 。 如 何 有 效 
染 


不 
些 污 染 , 是 各 国政 府 及 学 者 迫切 需要 解决 的 难题 。 然 而 ,这 些 污染 的 产生 受到 多 方面 的 影响 ,治理 起 
难 。 首 先 , 环 境 污 染 涉 及 的 过 程 复 杂 , 包 括 污染 物 排放 的 生物 过 程 .污染 物 在 承载 体 ( 大 气 `, 水 和 土壤 ) 申 的 物 
理 和 化 学 过 程 ;其 次 ,污染 成 因 很 多 , 主要 包括 工业 三 废 (废水 .废气 和 废 酒 ) .农业 污染 (肥料 农药 和 农 膜 ) 、 
后 ,影响 污染 因素 多 ,因素 之 间 存 在 相 下 重合 和 交叉 


染 
机 动车 尾气 排放 、 生 活 垃 圾 以 及 木材 和 煤 等 燃料 燃烧 ，; 
作用 。 因 此 , 仅 靠 传统 单 因 素 单独 治理 污染 不 能 解决 根本 问题 ,这 就 需要 通过 利用 云 计算 多 元 数据 同化 、 多 
尺度 数据 耦合 .时空 分 配 和 化 学 物种 分 配 等 大 数据 技术 对 各 种 环境 污染 及 其 相关 的 数据 进行 多 因素 融合 分 
析 , 及 时 准确 地 发 现 各 种 污染 的 根源 ,分 析 不 同 污染 过 程 中 污染 物 的 演变 规律 ,了 解 各 种 主要 污染 物 的 “前 世 
今生 ” ,全面 地 获得 污染 物 的 变化 规律 和 传输 过 程 ,通过 这 些 信息 来 区 分 环境 污染 的 轻重 绥 急 ,统筹 规划 治理 


方案 ,分 步 推 进 污 染 治 理 , 既 要 综合 治理 也 要 重点 突破 "|。 
另 一 方面 ,环境 污染 对 人 类 影响 具有 沸 后 性 ,污染 发 生 时 很 难 感知 和 预料 ,但 这 些 影响 一 旦 产生 就 表示 已 
经 发 展 到 相当 严重 的 地 步 。 因 此 ,除了 增强 污染 事后 治理 , 还 需 加 强 污 梁 事 前 预防 。 当 前 环境 污染 很 大 程度 
上 还 只 限于 治理 ,很 少 采 取 预 防 措施 ,更 缺少 对 重大 环境 污染 事件 的 预报 预测 。 目 前 ,我国 环境 污染 的 预测 预 


报 主 要 是 通过 各 种 数据 建立 统计 模型 ,但 这 些 模 型 的 参数 缺 寡 优 候 $ 预 报 预测 准确 性 低 …” 。 例 如 ,我国 已 经 
开发 了 一 些 污染 物 扩散 预测 模型 ,可 由 于 缺乏 这 些 污 染 物 长 期 实时 数据 ,不 能 对 模型 参数 优化 ,使 得 预报 预测 


的 准确 性 低 。 大 数据 时 代 的 到 来 ,为 提高 我 国 环境 污染 预报 预测 带 来 了 机 遇 。 随 着 云 计算 机 咒 学 习 和 人 工 


总 
bE 等 技术 的 不 断 发 展 ,使 得 建立 基于 认 知 计算 的 高 精度 环境 污染 预报 系统 成 为 可 能 。 环 保 部 门 积累 的 环境 
污染 应 急 管控 经 验 可 以 加 入 认 知 计算 系统 ,使 得 应 急 管控 变 为 常态 管理 ,例如 ,可 以 将 专家 经 验 加 入 认 知 计算 
系统 中 。 认 知 计算 整合 优化 各 类 模型 ,包括 物理 化 学 过 程 .气象 交通 和 社交 等 ,它们 再 通过 海量 数据 进行 交 
| 练 、 自 我 思考 和 上 自我 学 习 的 方式 不 断 积 累 ,为 可 靠 追 溯 污 染 


智和 


又 验证 ,该 算法 使 模型 数据 和 专家 经 验 以 自动 j 
源 .高 精准 预报 预测 精细 预防 和 治理 等 决策 提供 科学 支撑 ' "| 。 
随 着 全 球 人 口 数量 的 增长 和 社会 经 济 的 发 展 ,生态 系统 退化 越 来 越 严 重 , 已 经 成 为 全 球 严 重 的 生态 环境 
巨大 经 济 损失 ,还 严重 威胁 到 人 


3.2 大 数据 在 改善 生态 退化 中 的 优势 
问题 之 一 。 当 前 全 球 生态 退化 主要 表现 在 森林 面积 减少 .土地 退化 ,生物 多 样 性 降低 ,水 资源 短缺 等 方面 ,这 
生态 退化 除了 造成 


些 退 化 引起 了 全 球 森 林 资 源 , 水 资源 和 土地 资源 的 减少 
首先 , 绚 起 生态 退化 因素 较 多 ,主要 包括 乱 砍 滥 伐 .过 度 农 垦 、 陡 坡 开明 .生境 丧失 .生物 资源 过 度 开 发 ,水 


类 健康 和 生命 安全 。 

环境 遭 破 坏 、. 外 来 物种 人 侵 海洋 的 过 度 捕捞 以 及 环境 污染 等 “” 。 以 上 因素 相互 交织 ,协同 作用 ,致使 一 种 
生态 退化 类 型 可 能 是 另 一 种 退化 的 原因 ,例如 ,森林 面积 减少 可 引起 土地 退化 .生物 多 样 化 减少 ,水 资源 短缺 
加 重 另外 ,生态 退化 是 一 个 复杂 和 综合 的 动态 过 程 , 它 涉及 跨 领 域 . 跨 学 科 , 鉴 部 门 的 各 种 生态 环境 数据 ,又 
与 社会 经 济 .文化 和 政策 等 领域 密切 相关 ;同时 涉及 土壤 ,农学 .生态 、 环 境 和 生物 等 学 科 的 知识 。 过 去 几 十 
年 ,虽然 各 国政 府 也 采取 了 一 些 措 施 治理 生态 退化 ,但 由 于 生态 退化 所 涉 数据 来 源 多 样 .分布 广 泛 ,内 容 庞杂 、 
涉及 部 门 众多 ,而 传统 技术 不 能 系统 地 整理 和 分 析 这 些 数据 集 ,也 不 能 完全 提纯 出 数据 背后 的 有 价值 信息 ,或 

么 济 


者 由 于 技术 落后 提炼 出 的 信息 为 错误 的 ,以 这 些 错 误 的 科学 数据 信息 作为 理论 指导 ,使 得 政府 的 经 济 政策 和 
防治 决策 对 生态 退化 没 用 ,甚至 失误 ” 。 目 前 , 随 着 大 数据 的 蓬勃 发 展 ,人 们 可 以 利用 传感器 技术 和 无 线 通 


信 技 术 在 数据 获取 方面 的 优势 ,系统 地 收集 ,整理 和 存储 各 种 与 生态 退化 相关 的 数据 ,包括 地 面 监 测 数据 、 遥 
感 影像 数据 .社会 经 济 数据 .科学 研究 数据 .互联 网 以 网 站 论坛. 微 博 等 方式 发 布 的 有 关 资 源 环境 的 相关 信 
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息 ,实现 了 生态 环境 数据 的 整合 和 充分 利用 ,为 生态 系统 的 资源 管理 .生态 环境 的 动态 监测 和 生态 环境 评价 提 
供 多 样 化 .专业 化 和 智能 化 的 数据 服务 ;利用 分 布 式 数 据 库 . 云 计 算 、 人 工 智能 、. 认 知 计算 等 技术 在 大 数据 处 理 
方面 的 优势 ,并 结合 大 数据 各 种 算法 库 模型 库 和 知识 库 分 析 这 些 不 同 结构 的 数据 ,实现 数据 与 模型 的 融合 ， 
挖掘 隐藏 在 海量 数据 背后 的 各 种 信息 '*” ,通过 这 些 信息 既 可 以 分 析 各 种 生态 系统 退化 的 过 程 和 规律 ,也 可 
以 为 决策 者 提供 360 度 的 数据 信息 ,为 治理 和 预防 生态 退化 提供 正确 的 科学 决策 。 例 如 ,使 用 Hadoop 的 分 布 
式 文件 系统 (HDFS) 和 分 布 式 数据 库 (MapReduce) 对 生态 环境 大 数据 进行 批量 处 理 ; 利 用 决策 树 、 贝 叶 斯 AK- 
Means 、 岭 回归 模型 .逻辑 斯 带 模 型 线性 回归 模型 认 知 算法 .关联 规则 的 Apriori 算法 等 各 种 模型 和 算 污 对 海 
量 数据 进行 深度 挖 气 和 关联 分 析 , 通 过 各 种 数据 的 碰撞 产生 出 有 价值 的 信息 。 
3.3 ”大 数据 在 减缓 气候 变化 中 的 优势 

近 百 年 来 ,由 于 气候 自然 波动 和 人 类 活动 引起 的 温室 效应 ,地 球 气 候 正经 历 一 次 以 全 球 变 暧 为 主要 特征 
的 显著 变化 。 全 球 变 暧 导 致 了 极端 气候 出 现 频 率 增加 、 厄 尔 尼 诺 现象 加 剧 且 影响 范围 变 大 冰川 萎缩 、 内 陆 冻 
土 加 剧 融化 沙漠 化 加 剧 、 海 平面 上 升 和 海水 倒灌 水 资源 短缺 加 重 、 湿 地 面积 减少 和 举 物 多 样 性 下 降 。 例 如 ， 
在 2001 一 2010 年 ,全 球 冰 川 平均 质量 年 下 降 速 度 为 0.54 m( 相当 于 水 当量 )536 /全球 变 暖 除了 引起 全 球 气候 
变化 ,还 对 农业 、 生 态 环 境 和 人 体 健 康 产 生 了 巨大 的 影响 。 大 气 中 温室 气体 浓度 增加 引起 了 大 气温 室 效 应 增 
强 , 并 最 终 导致 了 全 球 气候 变 暖 ,温室 气体 主要 包括 CO, CH 和 N,O8 为 减缓 和 预测 全 球 变 上 暧 的 速度 ,政府 
间 气 候 变 化 专门 委员 会 (IPCC) 编 制 了 各 种 温室 气体 的 排放 源 和 吸收 汇 的 全 球 清单 ,并 预测 了 未 来 全 球 温度 
的 变化 ;各 个 国家 也 都 根据 本 国 实际 拥有 数据 情况 编制 国家 温室 气体 清单 。 但 目前 这 些 温室 气体 清单 还 都 不 
是 实时 清单 ,都 是 温室 气体 排放 和 吸收 的 总 量 。 这 主要 是 因 办 饼 少 温室 气体 的 实时 监测 数据 和 缺少 处 理 海量 
数据 的 技术 。 在 大 数据 时 代 , 网 络 信息 技术 和 无 线 通信 技术 的 融合 , 极 大 地 促进 了 各 种 智能 传感器 的 快速 兴 
起 和 发 展 ,使 我 们 可 以 获得 温室 气体 .气候 等 大 量 实时 监测 数据 和 与 之 相关 的 非 结 构 化 数据 ;基于 云 计 算 环 境 
下 ,分布 式 数据 存储 技术 与 传统 的 关系 型 数据 库 相 结合 可 以 解决 海量 数据 的 存储 和 管理 ,例如 , Hbase Redis 
和 Key-Value 等 大 数据 存储 技术 :4 ; 同 理 ,这 些 海量 温室 气体 .气候 和 其 他 相关 数据 的 处 理 分 析 也 需要 各 种 
模型 和 算法 ,但 对 于 编制 实时 温室 气体 清单 来 说 \ 最 关键 技术 是 怎样 在 线 和 离线 相 结 合 对 海量 数据 进行 分 析 ? 
离线 静态 数据 的 大 数据 处 理 形 式 是 批量 处 理 ,Hadoop 是 典型 的 批量 数据 处 理 系统 ;在 线 数据 的 大 数据 处 
理 形式 包括 实时 流 式 处 理 和 实时 交 豆 计算 两 种 , 流 式 数 据 处 理 系统 如 Storm、Scribe 和 Flume 等 ,交互 式 数据 
处 理 系统 如 Spark 和 Dremel。 另 外 ,利用 大 数据 技术 融合 温室 气体 数据 和 气候 模型 ,预测 未 来 温度 的 变化 速 
度 ,例如 ,人 工 智能 和 记 知 算法 等 天 数据 技术 。 通 过 编制 实时 温室 气体 清单 和 预测 未 来 温度 变化 幅度 ,可 以 为 
制定 减 排 措施 提供 科学 依据 ,同时 也 为 人 们 的 生活 带 来 方便 。 可 以 发 现 ,生态 环境 问题 彼此 相互 联系 ,相互 影 
响 ,相互 制约 。 因 此 ,治理 和 预防 需要 对 区 域 甚至 全 球 的 生态 环境 情况 进行 全 面 分 析 , 找 到 关键 问题 与 关键 区 
域 ,制定 不 同 的 解决 方案 与 对 策 ,通过 对 比分 析 找 到 最 优 解决 途径 。 利 用 大 数据 在 数据 采集 .数据 存储 数据 
分 析 ,以 及 数据 解释 和 展示 等 方面 的 优势 ,有 利于 揭示 生态 环境 问题 的 本 质 , 并 分 析 其 背后 的 驱动 因素 及 相互 
作用 机 制 。 在 数据 采集 方面 ,通过 建立 高 密度 .全 区 域 和 多 方位 的 监测 网 络 体系 .21 ,配合 文本 图片.XML、 
HTMIR 各 类 报表 ,图像 和 音频 /视频 信息 等 与 生态 环境 相关 的 非 结 构 化 数据 和 半 结 构 化 数据 的 采集 ,共同 形 
成 下 态 环 并 大 数据 集 。 在 数据 存储 方面 ,NoSQL(Not only SQL) 数据 存储 包括 分 布 式 文件 系统 和 分 布 式 数据 
库 承 统 二 种 类 型 :%] 。 通 过 与 大 数据 的 NoSQL 数据 存储 管理 技术 相 结合 ,克服 传统 关系 型 数据 库 经 常 由 于 采 
用 分 片 技术 而 出 现 的 存储 空间 不 够 .数据 加 载 缓慢 和 排队 加 载 等 问题 ! 汪 2 。 在 数据 分 析 方 面 ,我 国生 态 环境 
相关 的 数据 大 多 是 数据 集成 , 供 客户 端 自 行 下 载 分 析 ; 而 大 数据 分 析 却 能 将 统计 分 析 、 深 度 挖 气 、 机 器 学 习 和 
智能 算法 与 云 计算 技术 结合 起 来 '*””1 ,对 空气 .土壤 水文. 生物 多 样 性 .气候 .人 口 和 社会 经 济 等 数据 进行 关 
联 性 分 析 ,这 些 分 析 结 果 可 为 管理 者 的 决策 提供 科学 支持 。 除 此 之 外 ,在 数据 解释 和 展示 上 ,传统 数据 显示 方 
式 是 用 文本 形式 下 载 输 出 ,而 大 数据 却 可 以 给 用 户 提供 可 视 化 结果 分 析 ' 拓 ?1 。 由 此 可 见 , 只 有 大 数据 时 代 我 
们 才能 够 真正 实现 复杂 生态 环境 问题 的 定量 评估 和 精准 决策 ,为 加 快 我 国生 态 文明 建设 和 促进 生态 环保 事业 
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的 发 展 提供 科学 依据 和 有 效 对 策 。 
4 生态 环境 大 数据 面临 的 挑战 


虽然 大 数据 为 解决 各 种 生态 环境 问题 提供 了 新 的 机 遇 ,然而 生态 环境 大 数据 的 大 规模 应 用 才刚 刚 起 步 。 
生态 环境 大 数据 的 真正 实施 在 数据 开放 和 共享 ,大 数据 处 理 技术 .资金 投入 .专业 人 才 应 用 创新 和 数据 管理 
等 方面 还 面临 着 诸多 挑战 。 
4.1 缺乏 数据 共享 

生态 环境 大 数据 需要 整合 和 集成 政府 多 部 门 和 社会 多 来 源 的 数据 (例如 个 人 和 企业 等 ) ,只 有 不 同类 型 
的 生态 环境 大 数据 相互 连接 、 磁 撞 和 共享 ,才能 释放 生态 环境 大 数据 的 价值 。 因 此 ,要 想 控 掘 隐 藏 在 生态 环境 
大 数据 背后 的 潜在 价值 ,实现 数据 共享 是 关键 ,也 是 解决 生态 环境 问题 的 前 提 和 基础 。 然 而 ,实现 数据 共享 还 
面临 巨大 挑战 。 首 先 ,我 国生 态 环 境 大 数据 包括 气象 水利 生态、 国土 .农业 、 林 浊 交通 ,社会 经 济 等 其 他 部 
门 的 大 数据 ,涉及 多 领域 多 部 门 和 多 源 数 据 ,虽然 目 前 这 些 部 门 已 经 建立 了 自己 的 数据 平 傅 ,但 这 些 平台 之 
间 互 不 连通 ,只 是 一 个 个 的 “数据 孤岛 "5 2 。 大 部 分 数据 只 是 公开 ,而 非 开 放 , 即 数据 只 是 发 布 和 公开 , 而 无 
法 下 载 和 利用 数据 "1 , 仅 限于 “看 ”, 而 无 法 真正 去 “用 ” ,很 多 生态 环境 数据 还 在 档案 柜 里 “ 睡 大 觉 ”。 其 次 ， 
数据 没有 规范 化 ,数据 存储 格式 不 一 样 ,即使 在 同一 个 行业 ,数据 也 是 ”一 从 一 个 模样 ” ,形成 了 “拥有 者 不 一 
定 觉得 有 用 ,看 得 懂 、 用 得 着 的 不 一 定 能 拥有 ”的 局 面 。 我国 至 今 还 有 大 旱 与 生态 环境 相关 的 历史 资料 还 不 
是 电子 形式 ,由 于 缺乏 有 效 的 数字 化 技术 和 手段 ,早期 积累 的 很 多 纸 质 档案 资料 面临 破损 与 消失 的 风险 ,这些 
宝贵 档案 资料 的 数字 化 也 是 一 个 较 大 的 挑战 。 男 外 ,数据 开放 严重 不 是 ,主要 表现 在 数据 开放 总 量 偏 低 ,可 机 
读 性 差 , 大 多 为 静态 数据 ,日 集 中 在 经 济 发 达 ,政府 信息 化 基础 和 了 产业 发 展 好 的 城市 。 最 后 ,生态 环境 数据 
的 整合 和 脱 敏 也 是 一 项 重大 挑战 ,因为 开放 数据 即 任何 人 都 能 自由 下 载 和 利用 机 器 可 读 的 数据 格式 ,所 以 哪 
些 数据 可 以 公开 ,哪些 数据 敏感 ,需要 脱 敏 等 等 ,这 些 都 是 需要 耗费 巨大 人 力 物力 的 工作 。 
4.2 缺乏 技术 创新 和 落地 

在 数据 来 源 方面 ,生态 环境 大 数据 来 源 几 种 多 样 , 既 包 括 各 种 “ 空 天 地 ”的 监测 和 调查 数据 ,也 包含 各 种 
影像 .声音 和 视频 等 非 结构 化 数据 ,这 些 庞大 的 数据 杂乱 无 草 、 参 差 不 齐 ,如 何 将 这 些 多 源 异 构 数 据 转 换 成 合 
适 的 格式 和 类 型 ,并 在 存储 和 处 理 考 前 对 采集 的 数据 进行 去 粗 取 精 , 并 保留 原 有 数据 的 语义 以 便 后 面 分 析 , 是 
生态 环境 大 数据 面 对 的 一 个 技术 挑战 。 目 前 常用 的 是 通过 数据 清洗 和 整理 技术 对 其 填补 数据 残缺 , 纠正 数 
据 错 误 , 去 除数 据 元 余 , 焰 所 需 的 数据 抽取 出 来 进行 有 效 集成 , 并 将 数据 转换 成 要 求 的 格式 ， 从 而 达到 数据 
类 型 统一 数据 格式 一 致 数 据 信息 精练 和 数据 存储 集中 等 要 求 沁 ?和 。 例 如 ,LSI 公司 开发 了 一 款 多 核 处 理 
器 可 对 数据 进行 实时 分 类 降低 网 络 流量 。 在 数据 存储 方面 ,当前 生态 环境 大 数据 由 于 各 种 移动 终端 和 网 络 
的 视频 文本 图片 .照片 等 非 结 构 性 数据 流 正在 爆发 性 增长 ,未 来 存储 技术 的 效率 对 于 提高 大 数据 的 价值 至 
关 重 要 ,包括 存储 的 成 本 和 性 能 。 相 比 于 传统 的 物理 机 器 存储 (包括 单机 文件 和 网 络 文件 系统 ) ,适用 于 生态 
环境 大 数据 的 分 布 式 存储 系统 提高 数据 的 元 余 性 .可 扩展 性 、 容 错 能 力 、 低 成 本 和 并 发 读 写 能 力 。 例 如 ,LSI 
的 闪存 技术 可 以 大 大 提升 数据 的 应 用 速度 。 因 此 ,需要 不 断 研发 进行 存储 技术 创新 ,将 操作 便捷 性 的 关系 型 
数据 库 和 灵活 性 的 非 关 系 型 数据 库 融 合 ,是 未 来 技术 创新 的 发 展 目标 。 在 数据 分 析 方 面 ,目前 Google 的 
MapReduce 系统 .Yahoo 的 S4 系统 .Twitter 的 Storm 系统 、Pregel 系统 等 分 别 从 离线 批量 计算 、 实 时 计算 、 图 数 
据 处 理 ”3 ,都 是 针对 不 同 的 计算 场景 建立 了 不 同 的 计算 平台 ,管理 运营 成 本 很 高 ,所 以 研发 适合 多 种 计算 
模型 的 通用 架构 是 生态 环境 大 数据 建设 和 发 展 的 急切 需求 。 另 外 ,数据 分 析 已 经 从 传统 的 通过 先 验 知识 人 工 
建立 数学 模型 到 建立 人 工 智 能 系统 ,通过 人 工 智能 和 机 器 学 习 技 术 分 析 生 态 环境 大 数据 是 未 来 解决 生态 环境 
问题 的 关键 手段 。 但 对 于 他 们 的 深度 学 习 还 需要 大 量 工程 和 理论 问题 人“ ,例如 ,基于 深度 神经 网 络 的 机 器 
学 习 , 其 模型 的 迁移 适应 能 力 以 及 大 规模 神经 网 络 的 工程 实现 。 众 所 周知 ,工具 、 开 源 以 及 框架 设施 是 大 数据 
技术 发 展 的 方向 ,因此 ,当前 大 数据 的 技术 创新 形成 了 “互联 网 公司 原创 一 一 开源 扩散 一 一 扩散 制造 商 产品 
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化 一 一 其 他 企业 使 用 ”的 产业 链 格 局 。 不 过 ,要 想 实现 生态 环境 大 数据 的 技术 和 应 用 一 体 化 发 展 ,企业 和 政 
府 部 门 必须 抛弃 “ 拿 来 主义 ”态度 ,只 有 加 强 对 技术 开源 社区 的 贡献 ,才能 加 强 对 技术 的 深入 理解 ,也 才能 


4902 
好 的 发 挥 大 数据 在 生态 环境 领域 的 应 用 “1 。 同 时 ,还 要 加 强 管理 制度 配套 和 工作 人 


技术 落地 。 
4.3 资金 投入 不 足 


目前 ,国内 外 对 生态 环境 大 数据 的 资金 投入 不 足 。 缺 乏 大 数据 重大 示范 项 目 ,大 部 分 国家 缺乏 生态 环境 


监测 设备 .计算 机 资源 和 数据 资源 等 基础 设施 的 投入 ,包括 网 络 服务 器 .数据 处 理 和 存储 系统 .数据 仓库 系统 : 
云 计 算 平 台 等 。 同 时 也 缺乏 对 生态 环境 大 数据 拓展 融资 渠道 ,缺少 地 方 政府 . 工 商 企业 和 有 实力 .有 需求 的 


4.4 缺乏 大 数据 专业 人 才 


展 的 战略 需要 ,尤其 是 现 有 的 高 等 教育 体系 学 科 分 类 明确 ,独立 性 比较 强 ,缺乏 学 科 之 间 的 交叉 融合 。 很 多 地 


生产 经 营 主体 参与 大 数据 融资 。 还 没有 成 熟 的 大 数据 产业 推广 模式 。 
大 数据 时 代 的 到 来 ,对 各 国 现 有 教育 体系 提出 了 全 新 的 挑战 。 大 数据 时 代 需 要 大 量 的 复兴 家 人 才 , 尤 其 
方 还 没有 开设 大 数据 相关 的 专业 和 课程 ,也 缺少 大 数据 环境 监测 ,全 千 信息 学 和 环境 信息 学 等 方面 人 才 培 养 。 


是 生态 环境 大 数据 涉及 的 学 科 众多 , 既 需 要 计算 机 、 通 讯 等 工程 技术 ,也 需要 数学 ,统计 、 人 工 智能 等 模型 技 
术 , 更 需要 生态 .环境 气象 .水文 .土壤 等 专业 知识 。 当 前 许多 地 区 的 教育 体系 不 符合 未 来 生态 环境 大 数据 发 


4.5 应 用 活力 不 足 


台 E 
据 在 生态 环境 领域 中 的 应 用 创新 ,使 大 数据 真正 成 为 提高 生态 环境 监 
2016 年 3 月 
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我 国生 态 环 境 大 数据 的 创新 应 用 还 很 有 限 ,大 数据 的 威力 远 远 未 能 发 挥 出 来 ,政府 综合 运用 生态 环境 大 
数据 的 能 力 较 低 , 没 有 形成 成 熟 的 生态 环境 大 数据 产业 链 和 有 影响 为 的 数据 企业 。 生 态 环 境 大 数据 在 气象 、 
水 利 . 国 土 . 农 业 、 林 业 、 交 通 、 社 会 经 济 等 各 部 门 的 应 用 本 刚刚 起 步 , 跨 领域 的 应 用 寥寥 无 几 。 如 何 促进 大 数 

管 能 力 现代 化 的 有 力 手段 ,是 目前 世界 


还 任 。 


2015 年 9 月 5 日 ,国务 院 公开 发 布 《4 国 血 院 关 于 印发 促进 大 数据 发 展 行动 纲要 的 通知 》( 以 下 简称 《 纲 


各 国正 在 探索 的 课题 。 
4.6 缺乏 数据 管理 
要 》) 。《 纲 要 》 系 统 部 署 了 大 数据 各 项 工作 ,并 指出 大 数据 已 成 为 提升 政府 治理 能 力 的 新 5 
环保 部 刚刚 发 布 了 《生态 环境 大 数据 建设 总 体 方案 》, 为 环保 系统 开展 生态 环境 大 数据 建设 提供 了 强 有 力 的 
政策 支持 和 技术 框架 。 在 大 数据 时 代 , 我 国政 府 严重 缺乏 对 数据 的 管理 ,同时 在 利用 大 数据 治理 生态 环境 问 
ES 3 


首先 ,政府 生态 环境 领域 职能 部 门 缺乏 “大 数据 ?思维 和 意识 。 我 国 已 经 数字 化 的 生态 环境 数据 资源 数 


A 
题 的 方式 上 也 面临 严峻 挑战 。 
量 和 质量 都 表现 出 “ 双 低 ”状态 ,例如 ,很 多 纸 质 档案 资料 面临 破损 与 消失 的 风险 ,如 气象 资料 。 有 些 政府 部 
门 不 知道 自己 有 什么 数据 ,自己 甚至 没有 “数据 清单 ”"。 男 外 ,生态 环境 大 数据 目前 还 没有 形成 统一 标准 的 数 
据 格 式 , 地 方 和 各 个 系统 都 在 制定 自己 的 数据 标准 ,目前 急需 对 数据 格式 进行 统一 的 标准 规范 ,这 是 实现 数据 


共享 和 开放 的 关键 “””; 。 

其 次 ,政府 的 现代 管理 理念 和 运作 方式 不 适应 “大 数据 ”管理 决策 的 要 求 。 生 态 环境 大 数据 开发 的 根本 
目的 是 以 数据 分 析 为 基础 ,帮助 政府 在 解决 生态 环境 问题 的 过 程 中 作出 明智 的 决策 。 因 此 ,要 改善 我 们 政府 
的 管理 模式 ,需要 管理 方式 和 整体 结构 与 大 数据 技术 工具 相 适 配 “” 。 例 如 ,在 应 急 管 理 的 事前 准备 . 事 中 响 
应 和 事后 救援 与 恢复 的 每 一 阶段 都 可 以 引入 大 数据 的 应 用 ,每 个 阶段 对 大 数据 的 应 用 程度 也 会 因 其 需要 应 对 
内 容 的 不 同 而 有 所 差别 。 如 果 各 个 部 门 不 能 改变 管理 模式 和 协同 配合 , 常 造成 人 为 的 损害 。 例 如 ,最 近 我 国 
南方 遭遇 的 台风 和 强 降雨 事件 ,如 果 人 们 利用 大 数据 的 思维 去 管理 ,可 以 通过 收集 地 面 气象 站 和 卫星 的 温度 、 
风速 和 降雨 量 的 小 时 数据 ,对 台风 和 降雨 进行 预测 时 空 分 布 ,可 以 事前 玖 散 大 众 ,挽救 国家 和 人 民 财 产 及 


不 境 大 数据 面临 严重 安全 隐患 。 大 数据 的 安全 主要 包括 大 数据 自身 安全 和 大 数据 技术 安 
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最 后 , 生 
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全 ,大 数据 自身 安全 指 在 数据 采集 ,存储 挖掘 .分 析 和 应 用 过 程 中 的 安全 ,在 这 些 计算 和 存储 过 程 中 由 于 
黑客 外 部 网 络 攻击 和 人 为 操作 不 当 造 成 数据 信息 泄露 ,外 部 攻击 包括 对 静态 数据 和 动态 数据 的 数据 传输 攻 
击 ,数据 内 容 攻 击 ,数据 管理 和 网 络 物理 攻击 “”。 例 如 ,很 多 野外 生态 环境 监测 的 海量 数据 需要 网 络 传输 ， 
这 就 加 大 了 网 络 攻击 的 风险 ,如 果 涉 及 到 军用 的 一 些 生 态 环境 数据 ,本 来 人 们 可 以 国内 共享 ,但 如 果 被 黑客 获 
得 这 些 数 据 ,就 可 能 推测 到 我 国 军 方 的 一 些 信 息 ,后 果 不 堪 设想 。 大 数据 技术 安全 是 利用 大 数据 技术 解决 信 
息 系统 安全 的 问题 “分 , 即 黑客 利用 大 数据 技术 对 生态 大 数据 进行 攻击 ,轻松 获得 很 多 涉及 国家 机 密 和 比较 
敏感 的 生态 环境 领域 的 数据 。 随 着 云 计 算 技术 的 发 展 ,数据 在 云端 的 存储 存在 严重 的 安全 隐患 。 例 好 有 国 
“楼 镜 门 " 事 件 ,美国 政府 就 是 通过 云 计 算 和 大 数据 技术 收集 大 量 数据 也 包括 各 国生 态 环境 敏感 数据 二 因此， 
我 国 未 来 应 加 强生 态 环境 大 数据 安全 技术 研发 .生态 环境 大 数据 信息 安全 体系 的 建设 和 管理 等 究 面 。 


5 结论 与 展望 


本 文 对 生态 环境 大 数据 在 解决 生态 环境 问题 中 所 面临 的 优势 和 挑战 进行 了 系统 的 梳理 和 概括 总 结 。 与 
传统 生态 环境 数据 库 相 比 ,生态 环境 大 数据 不 仅仅 是 各 类 生态 环境 数据 的 集成 ! 它 是 对 各 种 生态 环境 数据 进 
行 了 深入 分 析 并 与 其 他 相关 数据 进行 关联 分 析 后 的 数据 产品 ,同时 生态 环境 不 数 据 还 能 对 未 来 生态 环境 存在 
的 重大 风险 进行 预测 预报 ,并 给 管理 者 提供 科学 的 决策 。 在 数据 获得 方面 除了 政府 部 门 的 数据 外 ,生态 环境 
大 数据 也 包含 各 类 市 场 主体 .社会 组 织 、 科 人 研 教 育 机 构 等 各 类 团体 与 个 鸡 所 拥有 的 大 量 与 生态 环境 相关 的 数 
据 。 在 数据 存储 和 处 理 方面 ,利用 各 种 大 数据 技术 与 传统 技术 相 结合 处 理 生 态 环境 的 静态 .实时 和 图 的 海量 
数据 。 在 数据 分 析 和 挖掘 方面 ,借助 算法 库 .模型 库 . 云 计 算 A 居 工 智能 4 知识 库 对 生态 环境 大 数据 进行 座 度 控 
据 \ 认 知 计算 关联 分 析 、 趋 势 分 析 、 空 间 分 析 等 各 类 信息 挖 扎 ;实现 数据 与 模型 的 融合 ,开发 新 的 数据 产品 提 
升 大 数据 的 应 用 价值 。 在 数据 解释 上 ,生态 环境 大 数据 可 以 提供 给 用 户 可 视 化 大 数据 挖掘 展示 。 今 后 要 不 断 
加 强大 数据 技术 研发 .加 强 资金 投入 、 加 强 复合 型 人 才 培 养 、 加 强 数据 开放 共享 和 加 强生 态 环 境 大 数据 管理 等 
方面 ,最 终 实现 生态 环境 决策 管理 定量 化 精细 化 ,生态 环境 信息 服务 多 样 化 、 专 业 化 和 智能 化 ,为 我 国 社会 经 
济 可 持续 发 展 和 生态 文明 建设 奠定 基础 。 

此 外 ,鉴于 大 数据 在 解决 生态 环境 问题 中 面临 的 机 遇 和 挑战 ,借助 去 计算、 人工 智能 及 模型 模拟 等 大 数据 
分 析 技 术 , 生 态 环 境 大 数据 未 来 迫 杨 需要 开展 以 下 人 研究 。(1) 对 各 种 生态 环境 数据 进行 数据 标准 化 处 理 。 由 
多 个 部 门 组 成 专门 机 构 调 研 决定 数据 的 技术 规范 与 标准 ,搜集 ,整理 ,加工 已 有 各 个 部 门 历史 生态 环境 数据 ， 
实现 各 部 门生 态 环境 数据 资料 的 集成 。(2) 依托 现代 数据 存储 与 处 理 分 析 技 术 ,构建 生态 环境 大 数据 存储 与 
处 理 分 析 平 台 ,实现 生态 环境 大 数据 的 查询 更 新 和 维护 备份 等 功能 ,在 此 基础 上 ,对 生态 环境 数据 进行 集成 
分 析 和 信息 提取 。(3) 推 动 生态 环境 大 数据 与 国内 外 同类 数据 平台 的 对 接 。 推 动 生态 环境 大 数据 与 农业 农 
村 大 数据 .工业 和 新 兴 许 业 大 数据 ` 以 及 医疗 健康 和 交通 旅游 服务 大 数据 等 大 数据 平台 的 对 接 ,探索 各 相关 部 
门 数据 融合 和 协同 创新 应 用 ,实现 现代 农业 可 持续 发 展 ,减少 工业 污染 及 碳 排放 ` 流 行 性 疾病 的 预防 以 及 重点 
景区 生态 环境 保护 风险 预警 等 ;加 强国 际 交 流 ,使 我 国生 态 环境 大 数据 分 析 技 术 与 国际 接轨 ;为 解决 跨国 界 
跨 区 域 的 全 球 性 生态 环境 问题 提供 科学 依据 。 
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